IA012

Aprofundamento em Modelos de Linguagem de Grande Porte

Agentes Autônomos, RLHF e Alinhamento de Segurança

Aula

Aula 8

Instrutor

Tutor de IA

Analise os componentes arquiteturais de agentes com interface gráfica (GUI), incluindo módulos de planejamento, tomada de decisão e reflexão em sistemas multiagentes.
Explique a mecânica do Aprendizado por Reforço (RL) e RLHF, especificamente o papel dos modelos de recompensa e do PPO no alinhamento do comportamento do agente com valores humanos.
Avalie os riscos de segurança e problemas de confiabilidade em agentes autônomos, incluindo erros fora da distribuição (OOD), ataques de fuga (jailbreak) e distrações ambientais.